Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs

نویسندگان

  • Thomas Degris
  • Olivier Sigaud
  • Pierre-Henri Wuillemin
چکیده

In this paper, we apply a general reinforcement learning method to automatically design the behavior of non player characters of the Counter-Strike first person shooter computer game. The result of the learning process is a set of decision trees that represents compactly and easily readable a model of the problem itself and the decision policy of characters. Beyond this example, we discuss the potential benefits of our method to design the decision architecture of non player characters in commercial computer games. MOTS-CLÉS : Apprentissage par renforcement, Factorisation, Personnages non joueurs.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage par Renforcement Inverse pour la Simulation d’Utilisateurs dans les Systèmes de Dialogue

Résumé : Les systèmes de dialogue sont des interfaces homme-machine qui utilisent le language naturel comme medium d’interaction. La simulation d’utilisateurs a pour objectif de simuler le comportement d’un utilisateur humain afin de générer artificiellement des dialogues. Cette étape est souvent essentielle dans la mesure où collecter et annoter des corpus de dialogues est un processus coûteux...

متن کامل

Classification structurée pour l'apprentissage par renforcement inverse

Résumé : Cette contribution traite du problème de l’apprentissage par imitation par le biais de l’apprentissage par renforcement inverse (ARI). Dans ce contexte, un expert accomplit une tâche qu’un agent artificiel doit essayer de reproduire. L’ARI part du postulat que l’expert optimise avec succès une fonction de récompense ; le problème consiste à deviner cette fonction à partir de traces du ...

متن کامل

Apprentissage par démonstrations : vaut-il la peine d’estimer une fonction de récompense?

Résumé : Cet article propose une étude comparative entre l’Apprentissage par Renforcement Inverse (ARI) et l’Apprentissage par Imitation (AI). L’ARI et l’AI sont deux cadres de travail qui utilisent le concept de Processus Décisionnel de Markov (PDM) et dans lesquels nous cherchons à résoudre le problème d’Apprentissage par Démonstrations (AD). L’AD est un problème où un agent appelé apprenti c...

متن کامل

Filtrage bayésien de la récompense

Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...

متن کامل

Apprentissage Par Renforcement : Analyse Des Crit Eres Moyens Et Pond Er Es En Hori- Zon Fini

E : Les probl emes de d ecision pos es par l'optimisation stochastique en horizon ni en l'absence de mod ele peuvent ^ etre trait es par des m ethodes adaptatives. Dii erents algorithmes d'apprentissage par renforcement ont et e propos es, tels le Q-Learning ou le R-Learning, mais ils sont d eenis pour des probl emes a horizon innni. On propose ici une mod elisation en horizon ni avec une compa...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Revue d'Intelligence Artificielle

دوره 23  شماره 

صفحات  -

تاریخ انتشار 2009